运行环境 anaconda
python 版本 2.7.13
包含详细数据集和数据的使用,可视化结果,很快入门,代码如下
# -*- coding: utf-8 -*- __author__ = 'LinearSVC线性分类支持向量机:包含惩罚项的' # 导包 import matplotlib.pyplot as plt import numpy as np from sklearn import datasets, linear_model, cross_validation, svm # 数据集:鸢尾花数据集 ''' 数据数 150 数据类别 3 (setosa, versicolor, virginica) 每个数据包含4个属性:sepal萼片长度、萼片宽度、petal花瓣长度、花瓣宽度 ''' def load_data_classfication(): iris = datasets.load_iris() X_train = iris.data y_train = iris.target return cross_validation.train_test_split(X_train, y_train, test_size=0.25, random_state=0, stratify=y_train)